CALM Theorem

https://cacm.acm.org/research/keeping-calm/

CALM: Consistency As Logical Monotonicity

Program Consisitency: Consistencyの定義を、操作の順序づけから決定論的なプログラムの結果にシフトする考え方？

既存のConsistencyの議論(Linearizabilityなど)では、メモリアクセスの順序を制約することで一貫性を担保していた

このモデルでは、特定のプログラムの結果の一貫性に、Coordinationが必要かどうかの議論を曖昧にしていた

どのようなProblemであっても、Coordinationを必要としない解があるのか、それとも必要なのかをどうやって知ることができるのか?

アナロジー: 交差点問題。一時停止の信号をどう制御するかに腐心しなくても、片方の道にトンネルを掘れば信号自体をなくすことができる

Coordination-freeなComputational Problem: Coordinationを使わずに一貫性のある出力を計算することができる分散実装が存在するComputational problem

どのような問題群はCoordination-freeなのか? そしてどのような問題群はその外に位置するのか?

Coordination-freeな例: Distributed Deadlock detectionでは、Wait-for graphの全体が見えていなくても部分グラフにサイクルを見つけた時点でそこでデッドロックが発生していることがわかる

Coordination-freeでない例: Distributed GCでは、Rootからの参照グラフ全体が見えないとObjectの参照が一切ないことがわからないので、捨てられない。グラフ全体を知るためにCoordinationが必要

Def 1. A problem P is monotonic if for any input sets $ S, $ T where $ S \subseteq T $ P(S) \subseteq P(T)

Distributed Deadlock detectionは部分グラフのInputとOutputは全体グラフのInput/Outputに含まれる

Phantom deadlockもあるが、ここでは別にその存在について議論しているわけではないkekeho.icon

Theorem 1. Consistency As Logical Monotonicity (CALM): A problem has a consistent, corrdination-free distributed implementation if and only if it is monotonic

monotonicである場合、かつその場合に限り、問題は一貫性のある、Coordination-freeな分散実装を持つ

直感的には、monotonicな問題は、情報(Input)が欠落していても安全であり、協調無しで進めることができる。逆に非monotonicな問題は、新しい情報(Input)に直面したときにある性質の真理が変化することを懸念しなければならない。したがって、すべての情報が到着したことを知るまで先に進めない

monotonicな問題は、inputの到着順序に依存しない。non-monotonicな問題は、入力の順序で出力が変わる

Relational transducer: 形式的な分散計算モデル

分散計算可能性の証明には、何らかの形式的な分散計算モデルが必要なので、amelootらはRelational transducerを用いた

操作

Ingest and apply: 順序付けされていないリクエスト(レコード挿入・削除)のバッチを読み込んで、適用する

Query: ローカルのRelation(レコードの集合)をクエリして、計算処理を行う

非単調性をもたらすようなUniversal quantifier$ \forall, Negation-centric equivalent$ \neg\existsは使わない

例えば、$ \neg\exists x : P(x)というクエリが一時的に真でも、あとから追加で$ P(x)を満たす$ xがやってきて、偽になるかもしれない。これはmonotonicityを満たさないkekeho.icon

Send: クエリの結果をローカル・他マシンに送る

Theorem 1のifの証明の概要: monotonicなRelational transducerのネットワークでは、最終的に決定論的な入力を得て、決定論的な出力を生成する。また、実行中の任意の時点において、$ P(S) \subseteq T(S)。

only ifの証明:

メッセージを、Relational transducerのデータフローメッセージと、他のCoordinationに使うメッセージを分けて議論を進める。